EvoClass
AI023
Triton 程式設計入門
矩陣乘法與大語言模型運算子融合
課程
第 9 課
日期
2026-03-31
授課教師
AI 教練
時長
60 分鐘
學習目標
分析變壓器中 GEMM 的運算強度與效能上限
辨識變壓器模塊內記憶體受限與運算受限的作業
評估運算子融合策略,以降低全域記憶體存取的開銷
探討整合激活、歸一化與注意力層的實作模式